由福建農林大學尤民生教授和中國農業(yè)科學院(深圳)農業(yè)基因組研究所(簡稱“深圳基因組所”)張興坦研究員主持,聯(lián)合國內外多家單位的科學家共同合作成功破解鐵觀音基因組和茶樹演化史,研究成果于2021年7月15日以“Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis”為題發(fā)表在國際頂級期刊《自然遺傳學》(Nature Genetics)上。研究人員利用獨立開發(fā)的新算法攻克高雜合、高重復鐵觀音基因組組裝難題,并在此基礎上闡述了等位基因不平衡、茶樹群體演化和馴化等相關科學問題。
成功破解鐵觀音單倍體分型組裝技術難題
鐵觀音原產(chǎn)于福建省泉州市安溪縣西平鎮(zhèn),相傳于清朝雍正年間被當?shù)夭柁r發(fā)現(xiàn),因其葉形似觀音臉重如鐵而被乾隆賜名為“鐵觀音”。茶樹是自交不親和植物,更因長期的無性繁殖積累大量體細胞突變,導致基因組高度雜合、組裝難度很大。研究團隊利用自主開發(fā)的兩種算法(Khaper和ALLHiC)整合Illumina短讀長、PacBio CLR長讀長和高通量三維染色質捕獲技術(Hi-C),攻克高雜合基因組組裝難題,成功拼接了兩套鐵觀音基因組(圖1):單倍體參考基因組(monoploid reference genome)和單倍體分型基因組(haplotype-resolved genome)。茶樹是二倍體,含有15對同源染色體(2n=2x=30),單倍體參考基因組是篩選同源染色體中的一份拷貝作為代表組裝到染色體水平,而單倍體分型基因組是將來源于不同父母本的兩套同源染色體同時組裝到染色體水平。前者不區(qū)分等位基因,廣泛用于二倍體基因組的組裝;后者區(qū)分等位變異,更完整地呈現(xiàn)二倍體基因組的全部遺傳信息。
圖1. 鐵觀音基因組組裝和質量評估
(a)單倍體參考基因組circos圖,呈現(xiàn)15染色體特征;(b)Hi-C熱圖呈現(xiàn)15條染色體組裝質量;(c)LAI評估鐵觀音和已發(fā)表其他茶樹基因組組裝質量;(d)鐵觀音單倍體參考基因組和分型基因組的共線性比較。
利用等位優(yōu)勢基因應對“遺傳負荷”
鐵觀音距今已有約300年的栽培歷史,長期的無性繁殖積累大量體細胞突變(包括有害突變),增加了遺傳負荷(genetic load),導致其適應性降低。然而人們對無性繁殖作物如何應對遺傳負荷這一問題知之甚少。傳統(tǒng)的雜種優(yōu)勢現(xiàn)象可以由顯性效應和超顯性效應兩種假說解釋:顯性效應指個體傾向于利用有利于生長和發(fā)育的優(yōu)勢等位基因(或顯性基因)而忽略對個體不利的劣勢基因(或隱形基因);超顯性效應指雜合等位組合在多種生境下優(yōu)于任一純合等位的現(xiàn)象。研究人員基于鐵觀音分型基因組組裝,鑒定到14691個基因具有等位變異。RNA-seq分析顯示,其中1528個基因存在一致性的等位特異性表達(consistent allele-specific expression, consistent ASE),即其中一個等位基因在所有組織和樣本中的表達都高于另一等位基因;而只有386個基因存在非一致性的等位特異表達(inconsistent ASE),即兩個等位基因分別在不同的組織中存在特異高表達。前者可以被認為是具有顯性效應的基因,而后者是具有超顯性效應的基因。這一結果顯示,在無性繁殖的茶樹基因組中,顯性效應可能是其應對遺傳負荷的重要機制。面對大量積累的體細胞突變或有害突變,個體選擇使用未突變或對個體有利的等位基因維持其正常的生長發(fā)育和對環(huán)境的適應性。
大葉茶與小葉茶存在不同的演化和馴化歷史
茶樹遺傳多樣性較高。研究人員對161個茶樹品種和15個近緣種大理茶進行重測序分析發(fā)現(xiàn),這些個體聚類為三組,分別為大理茶(CT)、大葉茶(CSA)和小葉茶(CSS)。其中大葉茶分為兩個亞組,古大葉茶(ACSA)和栽培大葉茶(CCSA);而小葉茶分為四個亞組,依據(jù)其主要地理分布可以劃分為川陜贛(SSJ)、浙江和閩北(ZJNFJ)、閩南(SFJ)、兩湖(湖南和湖北)和安徽(HHA)。遺傳分析顯示各茶區(qū)存在頻繁的種質基因交流,其中一些與有記錄的茶樹雜交育種歷史相吻合(圖2)。比如茶樹黃玫瑰品種呈現(xiàn)出鐵觀音與黃棪基因組混合的組分,而黃玫瑰是兩者子代黃觀音和黃棪回交選育的優(yōu)良品種。這種頻繁的基因交流不僅出現(xiàn)在茶樹種內,在茶樹與近緣種間也普遍存在。研究人員通過對8個茶樹品種和山茶屬茶組的12個近緣物種系統(tǒng)發(fā)育分析發(fā)現(xiàn),這些物種呈現(xiàn)網(wǎng)狀演化模式,而非簡單的樹形演化。更多的證據(jù)表明,茶樹與近緣種間頻繁的雜交漸滲(introgression)是其網(wǎng)狀演化和維持茶樹遺傳多樣性的重要因素。
圖2. 茶樹的系統(tǒng)發(fā)育關系和群體結構
(a)重測序個體的地理分布;(b)系統(tǒng)發(fā)育樹;(c)重測序群體的主成分分析(PCA);(d)K=7模型下的群體遺傳結構圖,下方顯示了兩個有記錄的現(xiàn)代繁殖事件。
栽培茶樹品種主要分為大葉茶(C. sinensis var. assamica, CSA)和小葉茶(C. sinensis var. sinensis, CSS),兩者之間在形態(tài)上具有明顯差異。前者植株較高、葉片較大、多為喬木,主要生長在云南、廣東等溫度較高的地域;而后者植株較矮、葉片較小、多為小喬木或灌木,可以生長在北至山東等較寒冷地區(qū)。研究人員通過群體遺傳分析發(fā)現(xiàn)大葉茶和小葉茶具有不同的演化和馴化歷史。在距離約259-181萬年的格拉斯階時期,劇烈的氣候變化很可能導致了整個茶樹物種的群體收縮,這也是一次大葉茶和小葉茶共享的瓶頸事件。兩個變種分化后,小葉茶的生境遭遇了末次冰盛期,2.65-1.9萬年前的溫度驟降可能使得小葉茶出現(xiàn)了再一次的群體瓶頸,但隨后適應了環(huán)境的小葉茶迅速擴張,群體規(guī)模得到恢復(圖3)。
圖3. 茶樹的群體動態(tài)歷史
(a)小葉種(上)和大葉種(下)歷史有效群體大??;(b)過去42萬年的歷史溫度變化。
此外,人們對大葉茶和小葉茶制品的偏愛有所不同也導致了兩者經(jīng)歷了平行的馴化歷程(圖4)。大葉茶早期的馴化主要篩選了一些糖苷類物質轉運的相關基因,而在品種改良階段人們更關注生物堿和香氣揮發(fā)物相關的代謝途徑。例如,研究人員鑒定到CsXDH基因在大葉茶品種改良階段受到強烈的人工選擇,該基因編碼黃嘌呤脫氫酶,是咖啡因合成通路的重要基因[9]。小葉茶早期人工選擇的基因與植物防御和抗性相關,事實上這些受選擇的基因同時也參與到了重要的次級代謝產(chǎn)物的生物合成,例如R-檸檬烯、β-羅勒烯等途徑。作為兒茶素合成通路的關鍵基因,F(xiàn)3‘H也在這一過程中受到人工選擇。而在小葉茶品種改良過程中,人工馴化涉及到花發(fā)育和一氧化氮(NO)響應相關的基因。之前的研究表明,NO的積累可以加速γ-氨基丁酸的消耗從而幫助植物抵御冷脅迫[10],這一結果暗示著篩選耐寒的品種也是人工選育的重要目標。
茶樹的“綠色革命”基因
20世紀60年代,大規(guī)模推廣矮稈或半矮稈的水稻和小麥品種極大的提高了作物產(chǎn)量,解決了發(fā)展中國家急劇增長的糧食需求,控制水稻株高的sd1基因和小麥的rht基因也因其巨大的貢獻被稱為“綠色革命基因”[11]。研究人員發(fā)現(xiàn),茶樹的株高在長期的栽培過程中也受到馴化,體現(xiàn)在兩個細胞色素P450家族基因受到人工選擇(CsBAS1和CsDWF4)。這兩個基因參與油菜素內酯合成,前者的擬南芥突變體導致了延長的下胚軸,而后者的突變直接導致了植株侏儒的表型[12-13]。
圖4. 大葉茶(CSA)和小葉茶(CSS) 人工選擇的特征與平行馴化的證據(jù)
(a) CSA與CSS平行馴化路線圖;(b) 基于XP-EHH識別的選擇性清除信號在全基因組的分布;(c) XDH基因中人工選擇的信號;(d)CM(脈絡膜類誘變酶)基因中的人工選擇信號;
(e) F3’H基因中人工選擇的信號;(f)與植物高度相關的BAS1和DWF4基因的人工選擇信號;(g)人工選擇基因的表達,包括根(RT)、莖(ST)、花(FL)、芽(BD)、幼葉(YL)、老葉(OL)。
該項目在攻克鐵觀音基因組的基礎上,通過對茶樹種群水平的遺傳分析,揭示了該物種的演化和人工馴化歷史。該成果為利用組學分析和分子生物學技術挖掘功能基因、解析其背后的遺傳調控機制,開展基于大數(shù)據(jù)驅動的基因組智能設計育種奠定了堅實的理論基礎,同時也為縮短育種周期、提高育種效率、降低育種成本提供了科學依據(jù)。
該項目由福建農林大學、深圳基因組所等國內外多家單位合作完成。深圳基因組所張興坦研究員、福建農林大學碩士研究生陳帥、福建省農科院水稻所施龍清博士、中國農科院煙草研究所龔達平研究員為論文共同第一作者,福建農林大學尤民生教授、唐海寶教授和深圳基因組所張興坦研究員為共同通訊作者。
來源:茶科學,信息貴在分享,如涉及版權問題請聯(lián)系刪除